透過這四個指標,混淆矩陣幫助我們計算出多種常見的評估指標,
這些指標能夠反映出模型在處理分類問題中的表現:
1.準確率 (Accuracy):
準確率是最簡單的一個衡量指標,表示模型預測正確的比例。
計算公式: Accuracy=TP+TNTP+TN+FP+FNAccuracy = \frac{TP + TN}{TP + TN + FP + FN}Accuracy=TP+TN+FP+FNTP+TN
適用場景:當正負樣本的數量比較均衡時,準確率是很好的指標。但當類別不平衡時,準確率可能會誤導我們。例如,在非常稀有事件(如罕見疾病檢測)中,即便模型全部預測為「負類」,其準確率也可能很高,因為正樣本非常少。
2.精確率 (Precision):
精確率表示所有預測為正樣本的案例中,有多少是真正的正樣本。
計算公式: Precision=TPTP+FPPrecision = \frac{TP}{TP + FP}Precision=TP+FPTP
適用場景:在我們更關心錯誤預測正類時(即False Positive),精確率是非常重要的指標。例如,在垃圾郵件分類中,我們不希望正常郵件被錯誤標記為垃圾郵件,因此精確率應該保持較高。
3.召回率 (Recall) 或稱為靈敏度 (Sensitivity):
召回率表示所有實際為正樣本的案例中,有多少被正確預測為正樣本。
計算公式: Recall=TPTP+FNRecall = \frac{TP}{TP + FN}Recall=TP+FNTP
適用場景:在我們更關心漏報正類時(即False Negative),召回率非常重要。例如,在醫療檢測中,我們希望最大化召回率,因為漏報患者的風險非常大。